Apprendre et Optimiser la courbe ROC

نویسندگان

  • Michèle Sebag
  • Jérôme Azé
  • Noël Lucas
چکیده

Un nouveau critère pour l’évaluation des hypothèses extraites par apprentissage supervisé a été introduit depuis la fin des années 90 : l’aire sous la courbe ROC (AUC). Ce critère induit une nouvelle approche de l’apprentissage, utilisant l’AUC comme critère de choix des hypothèses. L’approche présentée dans cet article s’attaque à l’optimisation de ce critère dans le cadre d’hypothèses linéaires. Comme il s’agit d’un problème d’optimisation mixte (combinatoire et continu), l’optimisation est réalisée par un algorithme d’évolution artificielle. L’algorithme résultant est validé expérimentalement sur des bases de données bien étudiées. Ses performances sont comparables à celles d’une machine à vecteurs supports, pour un coût de calcul inférieur d’un ou plusieurs ordres de grandeur. L’approche, motivée par la fouille de données médicales, est illustrée sur une application réelle et ses possibilités en termes de visualisation des hypothèses sont discutées. Mots-clés : Apprentissage Automatique, Optimisation, Fouille de Données Médicale, Fouille de Données Visuelle, Courbe ROC, Apprentissage Stable, Sélection de Traits.

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Interprétation graphique de la courbe ROC

Résumé. L’aire sous la courbe ROC est un outil pertinent pour mesurer la performance d’un classifieur et possède de nombreux avantages par rapport aux mesures de rappel et précision par classe : la performance est indiquée par une seule mesure et ne dépend pas des populations des classes. Cet avantage se transforme néanmoins en inconvénient lorsqu’il s’agit, lors de la lecture de la courbe, de ...

متن کامل

Classification multi-labels graduée: Apprendre les relations entre les labels ou limiter la propagation d’erreur ?

HAL is a multi-disciplinary open access archive for the deposit and dissemination of scientific research documents, whether they are published or not. The documents may come from teaching and research institutions in France or abroad, or from public or private research centers. L’archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion de documents scientifiques de niveau...

متن کامل

Structures de haies dans un paysage agricole : une étude par chemin de Hilbert adaptatif et chaînes de Markov

Résumé. Dans cet article nous présentons une approche couplant une courbe remplissant l’espace et une chaîne de Markov pour analyser des données spatiales concernant la localisation de haies. Du fait de l’hétérogénéité spatiale des données, nous utilisons une courbe adaptative de Hilbert qui permet de linéariser l’espace en s’ajustant localement à la densité des données. Pour ensuite exploiter ...

متن کامل

Prelinguistic Vocalizations: Relations between Function and Pitch

La présente étude explore les relations entre les fonctions communicatives des vocalisations pré-linguistiques et deux aspects prosodiques tels que le contour final de la fréquence fondamentale ainsi que son hauteur moyenne, minimale et maximale. Les productions vocales de dix enfants, âgés de 16 à 24 mois, ont été analysées. Les résultats définitifs confirment (1) la courbe descendante est le ...

متن کامل

Identification à la limite de langages dans le cadre d’un bruit systématique

Pour étudier l’apprentissage à partir de données bruitées, il est usuel de se baser sur un modèle de bruit statistique. L’influence du bruit est alors envisagée selon des critères pragmatiques ou eux-mêmes statistiques, en se basant donc sur un paradigme prenant en compte une distribution des données. Dans cet article, nous étudions le bruit comme un phénomène non statistique, en définissant la...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

عنوان ژورنال:

دوره   شماره 

صفحات  -

تاریخ انتشار 2003